Warsztaty badawcze

Praca domowa 2

Paweł Morgen

0. Wczytanie danych oraz modelu

1. Wybór obserwacji i wyliczenie predykcji

2. Dekompozycja predykcji dla wybranej obserwacji

Ta nieruchomość została oceniona wysoko. Największy wkład miały informacja o medianie zarobków, położeniu geograficznym oraz fakt, że nieruchomość nie jest w głębi lądu (INLAND = 0).

3. Porównanie dekompozycji dla różnych obserwacji

4. Komentarz

Real estatate is about location, location. location. We wszystkich rozważanych obserwacjach za istotne są zmienne latitude, longitude oraz opisujące położenie względem oceanu (INLAND, NEAR BAY etc.). Te zmienne są często istotne i mają podobny wpływ wśród wybranych obserwacji.

Pozostałe zmienne zachowują się różnie. Część z nich jest tylko czasami istotna (median_income, rooms_per_household, total_bedrooms, ...). Tym niemniej, wśród wybranych obserwacji podobne wartości zmiennych mają podobny wkład - nie zauważyłem sytuacji, gdzie zmienna miałaby raz wkład dodatni, raz ujemny.

Wydaje się, że ta metoda jest bardziej stablina (reliable) od metody BreakDown. Czytelnie tłumaczy pojedyncze predykcje i pozwala na częściowe zrozumienie modelu.